package ensa.sid.rida.SID;
import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class Rechercher {

public	int nombre_auteur = 0;
	 

	public void  lectureFichier(String fichier) {
		
		Document doc;
		try {
			InputStream ips = new FileInputStream(fichier);
			InputStreamReader ipsr = new InputStreamReader(ips);
			BufferedReader br = new BufferedReader(ipsr);
			String ligne;

			ConnexionBD c = new ConnexionBD();
			while ((ligne = br.readLine()) != null) {
				doc = Jsoup.connect(ligne).get();
				Elements links = doc.select("td:contains(Inventors:)");
				StringBuffer str = new StringBuffer(links.parents().get(0).text());
				String s = str.substring(11);
				System.out.println(s);
				s += ";";
				Pattern pattern = Pattern.compile("(.*?);(.*?);(.*?);");
				Matcher m = pattern.matcher(s);
		
				while (m.find()) {

					String req = "INSERT INTO auteur(auteur) VALUES  ('"+ m.group(2) + "');";
					c.ajouter(req);
					System.out.println(" auteur :"+ m.group(2));
					nombre_auteur++;
				}
		//	System.out.println("Nombre d'auteur dans ce lien :"+ nombre_auteur);
		 
			}

			br.close();
			c.fermer();

		} catch (Exception e) {
			System.out.println(e.toString());
		}
 
	}

 
}